TinyJudge: alineación de restricciones no verificables con conjuntos ligeros
TinyJudge alinea modelos de lenguaje con restricciones no verificables usando conjuntos ligeros de especialistas. Logra un 10% de rendimiento y 3x velocidad.
TinyJudge alinea modelos de lenguaje con restricciones no verificables usando conjuntos ligeros de especialistas. Logra un 10% de rendimiento y 3x velocidad.